查看原文
其他

Nature 亮点| AI助力肿瘤诊断新方法——组织和血液的微生物组学分析

Victoria BioArt 2022-04-16

撰文 | Victoria

责编 | 兮


天地鸿蒙之中,微生物无处不在,影响着生命活动的方方面面。这些微生物群落是否存在于肿瘤组织中(相关阅读见BioArt报道:Cell | 张煜博士等破解癌症之王——胰腺癌“长寿”人群的秘密?它们在肿瘤的发生中是否发挥作用?能否用这些微生物组学信息对肿瘤的临床诊断和治疗提供指导?迄今为止,大多数微生物组学的研究对象为肠道微生物。近年来,不断有证据表明在肿瘤组织以及患者血液中都存在微生物标记。


2020年3月11日,加州大学圣地亚哥分校Rob Knight教授团队在Nature杂志上发表题为Microbiome analyses of blood and tissues suggest cancer diagnostic approach的研究论文。在这篇文章中,作者对TCGA数据库中样本的全基因组和全转录组数据进行分析,包括来自于患者的肿瘤组织、癌旁组织和血液。通过人工智能(AI)机器学习等多种方法对数据进行归类分析,鉴定了与肿瘤类型相关的微生物DNA和RNA的特征,这些特征可能为肿瘤的临床诊断和预防提供新的切入点。由于涉及的肿瘤类型及样本数量巨大,该研究成为迄今为止肿瘤微生物组学研究最系统最全面的文章。



传统的观点认为肿瘤是受基因组调控的疾病。近期研究表明,微生物组在某些肿瘤中起着重要作用,然而,微生物组对不同肿瘤的贡献程度和诊断意义仍然未知。为了确定与肿瘤相关的微生物组,作者首先对TCGA数据库中来自33种肿瘤类型和10,481名患者的18,116个样品的全基因组测序(WGS;n = 4,831)和全转录组测序(RNA-seq;n=13285)进行了数据进行归一化(Supervised normalization,SNM)和净化分析(Decontamination analyses),并对其中的肿瘤微生物读数(microbial reads)进行挖掘,建立了系统的肿瘤微生物组数据集,使用AI来识别和区分不同肿瘤类型的微生物特征,并比较其性能。在这些基因序列数据中,7.2%为非人源,而这些非人源序列中有高达1/3的比例与已知的微生物基因序列一致。


图1. TCGA肿瘤微生物组分析CONSORT图


为进一步检验这些微生物组学特征能否在肿瘤区分中发挥作用,作者通过使用AI机器学习对肿瘤进行了区分,包括(1)区分不同肿瘤类型;(2)区分同一种肿瘤的不同分期;(3)区分肿瘤与正常组织。作者的数据显示这些微生物组特征在区分肿瘤类型以及区分肿瘤与正常组织方面表现良好,但对肿瘤的不同分期的区分中表现与肿瘤类型相关,如在区分结肠癌、胃癌和肾透明细胞癌的I期和IV期肿瘤方面表现良好,而在区分其他几种肿瘤的分期中欠佳。同时,作者在多个数据库中验证了结果的可重复性和普适性,并通过贝叶斯跟踪算法证明了这些微生物学特征在临床上的生物相关性。


此外,作者还将基于AI机器学习获得的微生物图谱与已知的肿瘤相关微生物进行了对比分析。与之前的报道一致,他们在胃肠道肿瘤中发现了梭形杆菌,在宫颈癌、头颈癌和肝癌中发现了α-乳头瘤病毒和肝炎病毒等。据此,作者建立了数据库(http://cancermicrobiome.ucsd.edu/cancermicrobiome_DataBrowser)以便搜索样本的标准化微生物丰度。


肿瘤游离DNA(cell-free tumor DNA,ctDNA)检测已经成为肿瘤诊断的重要手段,新近研究发现血源性微生物DNA(microbial DNA,mbDNA能够为肿瘤的临床特征提供信息。为挖掘mbDNA在肿瘤诊断中的作用,作者继续使用AI机器学习对TCGA队列进行分析,发现mbDNA的特征能够有效地区分不同的肿瘤类型。更重要的是,即使是对Ia–IIc 分级的肿瘤以及通过ctDNA无法检测到基因组变异的肿瘤,mbDNA具有更强的预测能力。文中检测到的血浆微生物丰度可在作者建立的数据库中查看。


图2 技术总结


在建立了以上预测模型的基础上,作者进一步使用正常人与肿瘤患者的mbDNA进行模型验证。结果显示,仅使用来源于受试者血浆的 mbDNA就能够有效地区分肿瘤患者与正常人,提示基于mbDNA的预测模型在肿瘤诊断中的有效性。但值得注意的是,该验证实验中涉及的肿瘤患者均为stage III–IV,而该模型在肿瘤早期预测中的效果仍待考察。


微生物的DNA和RNA存在于血液、正常组织和肿瘤中。不同类型的肿瘤和特定的微生物群之间存在广泛的联系,AI技术能够利用这些核酸特征。作者的AI模型在区分肿瘤类型、以及肿瘤与正常组织方面表现良好,但在区分肿瘤分期方面稍显不足。另外,这些结果还需在跨肿瘤类型的更大规模队列研究中进行验证。在此工作的基础上,还有许多进一步研究的空间。例如TCGA样品的采集方式无法控制引入微生物的污染,无法确定所测到的核酸是来自活的微生物、宿主细胞、还是来自肿瘤微环境和血液中的裂解细菌,未来研究应提高采样的质量控制测序技术以表征微生物特征。此外,对这些微生物进行分布(在肿瘤细胞?免疫细胞?还是结缔组织?)和功能(是原因?伴随效应?还是预后?)的研究也非常重要。最后,这些微生物如何进入癌组织并存在于其中的机制还有待深入研究,如何将其作为肿瘤治疗的靶标也有待探索。未来这一领域的进展将需要肿瘤学家和微生物学家之间的合作。尽管疑问很多,从微生物角度进行肿瘤的临床及基础研究依然充满契机,前景诱人。


原文链接:
https://doi.org/10.1038/s41586-020-2095-1


制版人:珂



参考文献



1. Bullman S, Pedamallu CS, Sicinska E, et al. Analysis of Fusobacterium persistence and antibiotic response in colorectal cancer. Science. 2017;358(6369):1443–1448. doi:10.1126/science.aal5240.

2. Bettegowda C, Sausen M, Leary RJ, et al. Detection of circulating tumor DNA in early- and late-stage human malignancies. Sci Transl Med. 2014;6(224):224ra24. doi:10.1126/scitranslmed.3007094.

3. Clark TA, Chung JH, Kennedy M, et al. Analytical Validation of a Hybrid Capture-Based Next-Generation Sequencing Clinical Assay for Genomic Profiling of Cell-Free Circulating Tumor DNA. J Mol Diagn. 2018;20(5):686–702. doi:10.1016/j.jmoldx.2018.05.004.


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存